更新时间:2024-05-03 16:26
NVIDIA Riva 是NVIDIA发布的一个完全加速的对话式AI 应用框架,用于构建使用端到端的多模态对话式AI服务。Riva 是由原先的 Jarvis 更名而来的,Riva 框架包括针对语音、视觉和自然语言理解(NLU)任务的优化服务。
Riva 能够帮助客户,即使在没有 AI专家的支持下,也能够快速地搭建和部署对话式AI 应用,并且支持定制化的对话式AI 服务,同时也能够降低部署对话式AI 的基础设施开销,从而降低了各个行业使用对话式AI 的门槛,提供更好的用户体验。
NVIDIA Riva 定制语音是 NVIDIA Riva 语音 AI 软件的一项功能,它提供功能,使数百万公司使用少量数据即可在几小时而不再是几周内开发定制语音。
企业可以使用 Riva 定制语音打造具有专属语音的虚拟助理。呼叫中心可以借其快速开发具有辨识度的品牌语音,为客户提供服务。开发者可以借其创建各种各样的应用程序,为有语言障碍的人提供支持。
NVIDIA Riva 近期增加了一些新功能,其预训练模型现已提供七种语言版本,除了新增的法语和印地语,也同时提高了英语、德语、普通话、俄语和西班牙语版本的准确性。此外,它还增加了字词级置信度评分和说话人分辨(即在音频流中识别说话人的过程)等功能。
作为汇集各种 GPU 优化的 AI 软件、模型和 Jupyter Notebook 示例的中心,NVIDIA NGC可让开发者轻松访问 Riva 和预训练模型。
• 自动语音识别(ASR):包括在 HuggingFace Open ASR 排行榜上名列前茅的模型 — Canary、Parakeet ASR 系列的多语言(英语、法语、德语和西班牙语)和多任务 ASR 以及双向翻译模型和英语转录模型 —以及英语和西班牙语/普通话/日语代码转换 ASR 模型。
• 文本转语音(TTS):提供 P-Flow 模型,该模型可以创建仅适用于企业的 3 秒音频样本的自定义语音(该模型赢得了 LIMMITS'24 挑战赛)以及 5 种语言的男女语音(英语)、德语、意大利语、普通话、西班牙语——根据上下文调整语音情绪(快乐、平静、中性、悲伤、恐惧、愤怒)。
• 翻译支持多达 32* 种语言的语音到文本、语音到语音 API 和文本到文本翻译,以及针对特定领域用例的模型定制.
• 用于问答聊天机器人的语音驱动检索增强生成(RAG)示例应用.